An Interface for Validating and Evaluating Thematic Timelines (Une interface pour la validation et l'évaluation de chronologies thématiques) [in French]
نویسندگان
چکیده
Actuellement, les journalistes de l’Agence France Presse (AFP) construisent manuellement des chronologies événementielles textuelles dans le but de contextualiser des événements médiatiques. Elles sont sous forme d’une liste de dates (généralement entre 10 et 20) associées à un texte décrivant l’événement ayant eu lieu à cette date. Nous avons développé un système capable de construire ce genre de chronologies événementielles thématiques à partir d’une requête utilisateur en utilisant un corpus de dépêches en français et en anglais fourni par l’AFP 1 . Nous considérons que les événements importants, ceux que nous souhaitons retrouver dans les chronologies, ont lieu à des dates importantes (du point de vue du thème imposé par la requête de l’utilisateur). Pour extraire les dates qui méritent de figurer dans une chronologie événementielle, les expressions temporelles dans les textes sont dans un premier temps reconnues et normalisées. Nous utilisons ensuite une approche par apprentissage pour extraire les dates saillantes pour un thème donné (Kessler et al., 2012). En sortie, notre
منابع مشابه
Une nouvelle mesure pour l'évaluation des méthodes d'extraction de thématiques : la Vraisemblance Généralisée
Résumé. Les méthodes dédiées à l’extraction automatique de thématiques sont issues de domaines variés : linguistique computationnelle, TAL, algèbre linéaire, statistique, etc. A ces méthodes spécifiques, peuvent s’ajouter des méthodes adaptées d’autres domaines, notamment de l’apprentissage automatique non supervisé. Les résultats produits par l’ensemble de ces méthodes prennent des formes hété...
متن کاملJade, un environnement d'administration autonome
RÉSUMÉ. Cet article présente la conception, la réalisation et l'évaluation de Jade, un environnement pour l'administration autonome d'infrastructures logicelles patrimoniales. Jade est essentiellement composé de deux parties : un canevas pour l'encapsulation des ressources administrées, qui leur donne une interface d'administration uniforme, et un canevas de construction de gestionnaires autono...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کاملExploration d'une collection de chansons à partir d'une interface de visualisation basée sur une analyse des paroles
Résumé. Dans cet article, nous présentons une approche de fouille de textes ainsi qu’une interface de visualisation afin d’explorer une large collection de chansons frana̧ises à partir des paroles. Dans un premier temps, nous collectons paroles et métadonnées de différentes sources sur le Web. Nous utilisons une approche combinant clustering et analyse sémantique latente afin d’identifier différ...
متن کاملInterface multi-facettes d'accès au capital documentaire de l'organisation
RÉSUMÉ. Les individus au sein des organisations modernes sont couramment amenés à rechercher de l’information, pour réaliser leurs activités. À partir des multiples sources interrogées, ils extraient des documents après en avoir le plus souvent évalué la pertinence. Chacun peut ensuite conserver dans son Espace Documentaire Personnel (EDP) les documents qu’il juge utiles pour ses activités. La ...
متن کامل